我们提出了一种从野外视频中重建全球人类传播的方法。我们的优化方法将相机和人类运动解散,这使我们能够将人们放置在同一世界坐标框架中。大多数现有方法不会对相机运动进行建模;依靠背景像素来推断3D人类运动的方法通常需要进行完整的场景重建,这对于野外视频通常是不可能的。但是,即使现有的SLAM系统无法恢复准确的场景重建,背景像素运动仍然提供足够的信号来限制相机运动。我们表明,相对摄像机的估计以及数据驱动的Human运动先验可以解决场景的歧义并恢复全球人类轨迹。我们的方法可靠地恢复了挑战野外视频(例如Posetrack)的全球3D轨迹。我们量化了对3D人数据集Egobody现有方法的改进。我们进一步证明,我们恢复的相机量表使我们能够在共享坐标框架中推理多个人的运动,从而改善了posetrack中下游跟踪的性能。
主要关键词
![arxiv:2302.12827V2 [CS.CV] 2023年3月20日PDF文件第1页](/bimg/9/95b52ea177348dfe3ab5d7e9d8e415818ca0bf59.webp)
![arxiv:2302.12827V2 [CS.CV] 2023年3月20日PDF文件第2页](/bimg/5/5cbf9df86f70a3ed0a0b51dd2152f4039f1f851f.webp)
![arxiv:2302.12827V2 [CS.CV] 2023年3月20日PDF文件第3页](/bimg/5/51eefe57daf9ccd4b5169cd14a03da8220bfaa85.webp)
![arxiv:2302.12827V2 [CS.CV] 2023年3月20日PDF文件第4页](/bimg/0/007073675dd9fd0d7610c4acb6352490f50f3379.webp)
![arxiv:2302.12827V2 [CS.CV] 2023年3月20日PDF文件第5页](/bimg/f/ff9017a8ffc28548cb9385b9f284d40ce275c7b9.webp)
